Bioestadística Aplicada

Tema 2.3 — Medidas de Tendencia Central
Tema 2.4 — Medidas de Dispersión

Nivel: Principiante

👉 Usa las flechas del teclado o los botones para navegar →

CONTENIDO

Temas de esta Clase

📊 2.3 Tendencia Central

Las medidas que resumen dónde está el "centro" de un conjunto de datos.

  • Media (promedio)
  • Mediana
  • Moda
  • Relación entre las tres y el sesgo

📈 2.4 Dispersión

Las medidas que indican cuánto se dispersan los datos alrededor del centro.

  • Rango
  • Desviación media
  • Varianza
  • Desviación estándar
💡 Idea clave

La tendencia central nos dice dónde está el centro de los datos. La dispersión nos dice cuánto se abiertos están alrededor de ese centro. Juntas dan una imagen completa.

2.3 — TENDENCIA CENTRAL

¿Qué es la Tendencia Central?

Si tu jefe te pide un resumen rápido de los datos de ventas del trimestre y solo tiene tiempo para escuchar un solo número, ese número debería ser una medida de tendencia central.

📌 Definición

Una medida de tendencia central es un valor que representa el centro de un conjunto de datos. Es un buen resumen de lo que podemos esperar del grupo en su conjunto.

Las tres medidas principales son:

📊 Media

El promedio clásico. Suma todos los valores y divide entre la cantidad de datos.

📍 Mediana

El valor del medio cuando los datos se ordenan de menor a mayor.

🏆 Moda

El valor más frecuente en el conjunto de datos.

⚠️ Dato curioso clínico

¿Cuál es el número promedio de dedos en las manos de la gente? No es exactamente 10. Es un poco menos de 10, porque el promedio incluye a las personas que han perdido dedos por traumatismos o intervenciones quirúrgicas. Si tienes 10 dedos, ¡tienes más que el promedio!

2.3 — TENDENCIA CENTRAL

La Media (Promedio)

La media toma la suma de todos los valores y la divide entre el número de datos. Cada dato contribuye por igual al cálculo.

Media (x̄) = x₁ + x₂ + … + xₙ n

🏥 Ejemplo 1

10 pacientes quirúrgicos tienen una duración total de cirugía de 50 horas.

Media = 50 ÷ 10 = 5 horas por cirugía.

💉 Ejemplo 2

Paciente A tiene TA sistólica de 120 mmHg y el Paciente B tiene 140 mmHg.

Media = (120 + 140) ÷ 2 = 130 mmHg. Pero ninguno tiene exactamente 130.

✅ ¿Cuándo usar la media?

Es buena cuando los datos están normalmente distribuidos (forma de campana simétrica, sin valores atípicos extremos). Es la medida más usada, pero puede ser engañosa cuando hay outliers.

2.3 — TENDENCIA CENTRAL

Cuando la Media es Engañosa

⚠️ Caso: Esperanza de vida en la Edad Media

La esperanza de vida promedio era de ~30 años. Pero esto se debe a una tasa muy alta de mortalidad infantil. Una persona que llegaba a los 30 años probablemente vivía hasta los 50. La media estaba distorsionada por los valores bajos.

El problema de los valores atípicos (Outliers)

Imagina una sala de hospitalización con 10 pacientes que todos tienen un nivel de colesterol de 180 mg/dL. La media y la mediana son 180.

Ahora ingresa un nuevo paciente con hipercolesterolemia familiar, con un nivel de colesterol de 1000 mg/dL.

📊 Antes del paciente atípico (10 pacientes)

Media = 180 mg/dL
Mediana = 180 mg/dL

📊 Después del paciente atípico (11 pacientes)

Media = ~254.5 mg/dL ← ¡se disparó!
Mediana = 180 mg/dL ← no cambió

📌 Conclusión

Un solo valor atípico puede arrastrar la media completamente. La mediana es más resistente a estos casos.

2.3 — TENDENCIA CENTRAL

La Mediana

La mediana es el valor central cuando ordenamos los datos de menor a mayor. A diferencia de la media, no usa el valor de cada dato en su cálculo, por lo que los outliers no la afectan tanto.

🔢 Cantidad impar de datos

Ejemplo: edad de 3 pacientes internados → 45, 52, 68 años

El valor central es 52. La mediana = 52 años.

El dato del medio directamente.

🔢 Cantidad par de datos

Ejemplo: edad de 4 pacientes → 45, 52, 68, 82 años

No hay un solo centro. Tomamos la media de los dos centrales:

Mediana = (52 + 68) ÷ 2 = 60 años

✅ ¿Cuándo usar la mediana?

Es preferible cuando los datos tienen valores atípicos o la distribución es muy asimétrica. Es más representativa de la "persona típica" del conjunto.

2.3 — TENDENCIA CENTRAL

La Moda

La moda es el valor que aparece con más frecuencia en un conjunto de datos. Proviene del latín modus (manera, estilo), de donde viene la expresión "a la moda".

🏥 Ejemplo: Encuesta de satisfacción con un tratamiento

Se encuestaron 400 pacientes sobre la efectividad percibida de un medicamento (escala del 1 al 5). 200 respondieron ⭐⭐⭐⭐⭐ (muy efectivo) y 200 respondieron ⭐ (no efectivo). El promedio resulta 3, pero nadie respondió 3. Las modas son 1 y 5, lo que revela que la opinión está dividida en dos subgrupos.

Tipos según la cantidad de modas

Unimodal

Solo un valor es el más frecuente.

📊

Bimodal

Dos valores son igualmente frecuentes.

📊📊

Multimodal

Varios valores son igualmente frecuentes. Sugiere varios subgrupos.

📊📊📊

✅ Ventaja única de la moda

Es la única medida que se puede usar con datos no numéricos. Ejemplo: si registramos el tipo de sangre de los pacientes de un banco de sangre, la moda podría ser "O+". No existe una "media" de tipos de sangre.

2.3 — TENDENCIA CENTRAL

Sesgo: la Relación entre las Tres

La relación entre la media, la mediana y la moda nos dice mucho sobre la forma de la distribución de los datos.

✅ Sin sesgo (Normal)

Media = Mediana = Moda

Distribución simétrica en forma de campana. Misma cantidad de datos a cada lado del centro.

🔺

⚠️ Sesgo positivo (derecha)

Media > Mediana > Moda

Hay valores grandes atípicos que arrastran la media hacia la derecha.

📈➡️

⚠️ Sesgo negativo (izquierda)

Media < Mediana < Moda

Hay valores pequeños atípicos que arrastran la media hacia la izquierda.

⬅️📉

🏥 Caso real: Duración de estancia hospitalaria

En el Periodo A, la media de estancia fue 8 días y la mediana 6 días. En el Periodo B (tras incorporar más casos quirúrgicos complejos), la media subió a 11 días, pero la mediana bajó a 5 días, porque la mayoría de los pacientes sencillos salían más rápido. Los pocos casos complejos arrastran la media hacia arriba. Las estadísticas pueden ser verdaderas y engañosas al mismo tiempo.

🎯 EJERCICIO 1

Práctica: Tendencia Central

📝 Instrucciones

Selecciona la respuesta correcta para cada pregunta.

2.4 — DISPERSIÓN

¿Qué es la Dispersión?

La dispersión mide en qué grado los valores de un conjunto de datos están esparcidos o agrupados alrededor de un promedio (como la media o la mediana).

🟢 Poca dispersión

Los datos están cerca del centro. Alta consistencia y uniformidad.

● ● ● ● ●

🔴 Mucha dispersión

Los datos están lejos del centro. Alta variabilidad.

● ● ● ● ●

📌 ¿Por qué importa?

La tendencia central nos dice dónde está el centro. Pero dos conjuntos de datos pueden tener la misma media y ser muy diferentes. La dispersión nos ayuda a entender la confiabilidad y la variabilidad de los datos.

Medidas principales de dispersión

  • Rango — diferencia entre el máximo y el mínimo
  • Desviación media — promedio de las distancias al centro
  • Varianza — promedio de las desviaciones al cuadrado
  • Desviación estándar — raíz cuadrada de la varianza
2.4 — DISPERSIÓN

El Rango

El rango es la medida más simple de dispersión: la diferencia entre el valor más grande y el valor más pequeño del conjunto.

Rango (R) = L − S

L = valor más grande  |  S = valor más pequeño

📊 Datos no agrupados

Edad de pacientes en consulta externa: {20, 24, 31, 17, 45, 39, 51, 61} años

Mayor = 61   Menor = 17

R = 61 − 17 = 44 años

📊 Datos agrupados

Días de estancia hospitalaria: intervalos 0-10, 10-20, 20-30, 30-40

Límite superior mayor = 40
Límite inferior menor = 0

R = 40 − 0 = 40 días

⚠️ Limitación del rango

Solo considera el máximo y el mínimo. Un solo valor atípico puede hacer que el rango sea muy grande, aunque el resto de los datos estén muy agrupados. No es el indicador más confiable por sí solo.

2.4 — DISPERSIÓN

La Desviación Media

La desviación media mide cuánto se desvian los datos del promedio, en promedio. Es más informativa que el rango porque considera todos los datos.

⚠️ ¿Por qué usar valores absolutos?

Si simplemente restamos la media a cada dato, las desviaciones positivas y negativas se cancelan. Ejemplo: el cambio de presión arterial respecto al valor base en 3 pacientes fue de -5, +10, +25 mmHg (media = 10). Las desviaciones son -15, 0 y +15 → suma = 0. Eso no nos dice nada útil. Por eso usamos el valor absoluto |d| de cada desviación.

D.M. = |x₁ − μ| + |x₂ − μ| + … + |xₙ − μ| n

μ = media  |  n = cantidad de datos  |  | | = valor absoluto

2.4 — DISPERSIÓN

Ejemplo Resuelto: Desviación Media

📋 Datos: Frecuencia respiratoria de 5 neonatos (respiraciones/min): {2, 4, 6, 8, 10}
1
Calcular la media:
μ = (2 + 4 + 6 + 8 + 10) ÷ 5 = 30 ÷ 5 = 6 resp/min
2
Calcular la desviación absoluta de cada dato:
|2 − 6| = 4    |4 − 6| = 2    |6 − 6| = 0    |8 − 6| = 2    |10 − 6| = 4
3
Sumar las desviaciones:
4 + 2 + 0 + 2 + 4 = 12
4
Dividir entre n:
D.M. = 12 ÷ 5 = 2.4 resp/min
✅ Resultado

La desviación media es 2.4 resp/min. Esto significa que, en promedio, cada neonato se aleja 2.4 respiraciones por minuto respecto a la media del grupo.

2.4 — DISPERSIÓN

La Varianza

La varianza también mide la dispersión, pero en lugar de usar el valor absoluto, eleva al cuadrado cada desviación. Esto le da más peso a los valores que se alejan más del centro.

🌐 Varianza de Población (σ²)

σ² = Σ (xᵢ − μ)² n

Se usa cuando tenemos todos los datos de la población.

📋 Varianza de Muestra (S²)

S² = Σ (xᵢ − x̄)² n − 1

Se usa cuando los datos son una muestra de una población mayor. Se divide entre n−1 para corregir el sesgo.

⚠️ Limitación

Como eleva al cuadrado las desviaciones, la varianza se expresa en unidades al cuadrado. Si los datos originales estaban en metros, la varianza estará en metros². Esto la hace difícil de interpretar directamente.

2.4 — DISPERSIÓN

La Desviación Estándar

La desviación estándar es simplemente la raíz cuadrada de la varianza. Al tomar la raíz cuadrada, los resultados vuelven a estar en las mismas unidades que los datos originales, lo que la hace mucho más fácil de interpretar.

D.E. (σ) = √(σ²) = √Σ (xᵢ − μ)²n

🔍 Interpretación

  • D.E. pequeña → datos muy agrupados alrededor de la media. Alta consistencia.
  • D.E. grande → datos muy esparcidos. Alta variabilidad.

📊 Ejemplo clínico

Si la media de niveles de glucosa en sangre es 100 mg/dL y la D.E. es 5, la mayoría de los valores estarán entre 95 y 105 mg/dL (alta consistencia).

Si la D.E. fuera 30, los valores estarían entre 70 y 130 mg/dL (alta variabilidad).

✅ ¿Varianza o Desviación Estándar?

En la práctica, la desviación estándar es más utilizada porque sus unidades son compatibles con los datos originales y es más fácil de interpretar.

2.4 — DISPERSIÓN

Medidas Absolutas vs Relativas

📐 Medidas Absolutas

Se expresan en las mismas unidades que los datos originales (mmHg, mg/dL, kg).

MedidaFórmula
RangoL − S
Desviación MediaΣ|xᵢ − μ| / n
VarianzaΣ(xᵢ − μ)² / n
Desviación Estándar√(Varianza)

📊 Medidas Relativas

Se usan para comparar dos conjuntos de datos con unidades diferentes. Se expresan como porcentajes o ratios.

MedidaFórmula
Coef. de Rango(L − S) / (L + S)
Coef. de Variación(σ / μ) × 100
Coef. de Desv. MediaD.M. / μ
💡 ¿Cuándo usar medidas relativas?

Cuando quieres comparar la dispersión de dos conjuntos que tienen unidades o escalas diferentes. Por ejemplo, comparar la variabilidad de la presión arterial (mmHg) entre dos hospitales con la variabilidad de la glucosa en sangre (mg/dL) en el mismo estudio.

🎯 EJERCICIO 2

Práctica: Cálculo del Rango

📝 Instrucciones

Completa los espacios en blanco con el valor correcto.

🎯 EJERCICIO 3

Práctica: Desviación Media

📝 Instrucciones

Sigue los pasos para calcular la desviación media del cambio de peso (kg) de 5 pacientes: {-5, -4, 0, 4, 5}. Completa cada paso.

🎯 EJERCICIO 4

Práctica: Dispersión — Opción Múltiple

📝 Instrucciones

Selecciona la opción correcta.

RESUMEN

Tendencia Central vs Dispersión

Característica Tendencia Central Dispersión
¿Qué mide? Dónde está el centro de los datos Cuánto se esparcen los datos
Pregunta ¿Cuál es el valor típico? ¿Cuánto varía entre sí?
Medidas Media, Mediana, Moda Rango, Varianza, D.E., D.M.
Ejemplo La presión arterial media es 120 mmHg La TA varía ±10 mmHg entre pacientes
🔑 Idea clave final

Un conjunto de datos bien descrito necesita ambas medidas. Decir solo "la TA media es 120 mmHg" no es suficiente si no sabemos si los valores van de 118 a 122 (poca dispersión) o de 80 a 160 (mucha dispersión). Centro + dispersión = imagen completa.

BIBLIOGRAFÍA

Fuentes y Recursos

🎥 Video — Crash Course Statistics

Medidas de Tendencia Central: Media, Mediana y Moda. Presentado por Adriene Hill. Explicación con ejemplos cotidianos de los conceptos de media, mediana, moda, valores atípicos y sesgo.

https://youtu.be/kn83BA7cRNM

📄 Artículo — GeeksforGeeks

Measures of Dispersion. Referencia técnica con definiciones, clasificación (absolutas vs relativas), fórmulas y ejemplos resueltos de rango, desviación media, varianza y desviación estándar.

https://www.geeksforgeeks.org/maths/measures-of-dispersion/

¿Preguntas?

Gracias por tu atención

1 / 22